Scalable and Distributed Resource Management for Many-Core Systems

نویسنده

  • Sebastian Kobbe
چکیده

German Version) Many-Core Systeme stellen die Forschung vor vielfältige neue Herausforderungen, darunter die Handhabung von sehr dynamischer und kaum voraussagbarer Rechenlast. Optimale Ressourcenverwaltung von Many-Core Systemen ist ein NP-vollständiges Problem. Die große Anzahl der zu verwaltenden Anwendungen und Kernen führt bei zentral agierenden Heuristiken, welche stets einen globalen Blick auf das gesamte System haben, zu Skalierbarkeitsproblemen. Die Ressourcenverwaltung selbst kann so zum Engpass werden, welcher wegen hohen Latenzen die erzielbare Leistung des Systems einschränkt. Der Schwerpunkt dieser Arbeit liegt im Erreichen von Skalierbarkeit der Ressourcenverwaltung. Die Komplexität der Ressourcenverwaltung wird durch verteilt stattfindende lokale Optimierungen gehandhabt. Jeder Anwendung wird ein eigener lokaler Ressourcenmanager zugewiesen, welcher den Bedarf an Ressourcen der Anwendung gegenüber den anderen Anwendungen vertritt. Die lokalen Ressourcenmanager kommunizieren über ein, sich am ” Contract-Net Protokoll“ und an sogenannten ” Gossip Protokollen“ orientierendes, Protokoll miteinander und verhandeln lokal darüber, wie die Verteilung der Ressourcen der betroffenen Anwendungen anhand eines vorgegebenen Optimierungsziels verbessert werden kann. Parallele Anwendungen, welche sich während der Laufzeit an die ihnen zugewiesenen Ressourcen anpassen können, erlauben die Aufteilung (und Umverteilung) der Kerne des Many-Core Systems unter den gerade gleichzeitig ausgeführten Anwendungen, so dass diese effizient ausgeführt werden können. Dabei ist es jedoch wichtig, vor einer Ressourcenzuweisung die Auswirkungen auf die erzielbare Leistung der jeweiligen Anwendung abschätzen zu können. Im Rahmen dieser Arbeit wurde ein adaptives Anwendungs-Performance-Modell entwickelt, welches anhand einer parametrischen Beschreibung der Anwendung abschätzt, welche Performance die jeweilige Anwendung unter einer bestimmten Ressourcenzuweisung erreichen wird. Es reagiert dabei auf spontane Variationen in der Belastung des Systems und berücksichtigt die topologischen Eigenschaften der Ressourcen. Im Vergleich zu vorherigen Anwendungs-Performance-Modellen wird der durchschnittliche Schätzfehler von 14,7% auf 4,5% reduziert. Die vorgestellten Ressourcenverwaltung kann verschiedene Optimierungsziele verfolgen, welche durch eine Zielfunktion vorgegeben werden. Unter diesen Optimierungszielen ist beispielsweise die Maximierung des Durchschnitts der Performance der jeweils gleichzeitig ausgeführten Anwendungen. Die Annäherung an das Ziel

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

Multi-objective and Scalable Heuristic Algorithm for Workflow Task Scheduling in Utility Grids

 To use services transparently in a distributed environment, the Utility Grids develop a cyber-infrastructure. The parameters of the Quality of Service such as the allocation-cost and makespan have to be dealt with in order to schedule workflow application tasks in the Utility Grids. Optimization of both target parameters above is a challenge in a distributed environment and may conflict one an...

متن کامل

Exploring Distributed Resource Allocation Techniques in the SLURM Job Management System

With the exponentially growth of distributed computing systems in both flops and cores, scientific applications are growing more diverse with a variety of workloads. These workloads include traditional large-scale High Performance Computing MPI jobs, and ensemble workloads, such as Many-Task Computing workloads comprised of extremely large number of tasks of finer granularity, where tasks are d...

متن کامل

Towards Next Generation Resource Management at Extreme-Scales

With the exponential growth of distributed systems in both FLOPS and parallelism (number of cores/threads), scientific applications are growing more diverse with various workloads. These workloads include traditional large-scale high performance computing (HPC) MPI jobs, and HPC ensemble workloads that support the investigation of parameter sweeps using many small-scale coordinated jobs, as wel...

متن کامل

Design and evaluation of two scalable protocols for location management of mobile nodes in location based routing protocols in mobile Ad Hoc Networks

Heretofore several position-based routing protocols have been developed for mobile ad hoc networks. Many of these protocols assume that a location service is available which provides location information on the nodes in the network.Our solutions decrease location update without loss of query success rate or throughput and even increase those.Simulation results show that our methods are effectiv...

متن کامل

Design and evaluation of two scalable protocols for location management of mobile nodes in location based routing protocols in mobile Ad Hoc Networks

Heretofore several position-based routing protocols have been developed for mobile ad hoc networks. Many of these protocols assume that a location service is available which provides location information on the nodes in the network.Our solutions decrease location update without loss of query success rate or throughput and even increase those.Simulation results show that our methods are effectiv...

متن کامل

Executable Modeling of Deployment Decisions for Resource-Aware Distributed Applications

The increasing popularity of virtualized services and cloud computing, offering elastic and scalable computing resources challenges software engineering methods by asking a number of new questions: How can we integrate deployment-specific information in the overall design of software applications? How can we express and compare deployment decisions in the design phase, so that performance diagn...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

عنوان ژورنال:

دوره   شماره 

صفحات  -

تاریخ انتشار 2015